AI资讯新闻榜单内容搜索-DeepSeek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: DeepSeek
DeepSeek R1 Zero中文复现教程来了!

DeepSeek R1 Zero中文复现教程来了!

DeepSeek R1 Zero中文复现教程来了!

各位同学好,我是来自 Unlock-DeepSeek 开源项目团队的骆师傅。先说结论,我们(Datawhale X 似然实验室)使用 3 张 A800(80G) 计算卡,花了 20 小时训练时间,做出了可能是国内首批 DeepSeek R1 Zero 的中文复现版本,我们把它叫做 Datawhale-R1,用于 R1 Zero 复现教学。

来自主题: AI技术研报
7695 点击    2025-02-07 17:54
实测华为小艺版 DeepSeek,和满血版 R1 有差别吗?

实测华为小艺版 DeepSeek,和满血版 R1 有差别吗?

实测华为小艺版 DeepSeek,和满血版 R1 有差别吗?

春节期间,互联网上最火的不是春晚小品,也不是春节档电影,而是 DeepSeek。

来自主题: AI资讯
5610 点击    2025-02-07 11:35
自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。

来自主题: AI资讯
5925 点击    2025-02-05 16:33
一招教你解决DeepSeek R1的卡顿问题。

一招教你解决DeepSeek R1的卡顿问题。

一招教你解决DeepSeek R1的卡顿问题。

整个过年,DeepSeek给我用的都卡炸了。 我自己在官方app和网页里,到现在也还是10条回复有8条是“服务器blabla,请稍后重试”。 每次见到这句话,我都想脑溢血。

来自主题: AI资讯
5714 点击    2025-02-05 11:38
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

过年这几天,DeepSeek 算是彻底破圈了,火遍大江南北,火到人尽皆知。虽然网络版和 APP 版已经足够好用,但把模型部署到本地,才能真正实现独家定制,让 DeepSeek R1 的深度思考「以你为主,为你所用」。

来自主题: AI技术研报
5755 点击    2025-02-04 19:57
LeCun痛批硅谷傲慢病!圈内爆火长文:DeepSeek R1-Zero比R1更重要,成AGI破局关键

LeCun痛批硅谷傲慢病!圈内爆火长文:DeepSeek R1-Zero比R1更重要,成AGI破局关键

LeCun痛批硅谷傲慢病!圈内爆火长文:DeepSeek R1-Zero比R1更重要,成AGI破局关键

奥特曼罕见地承认了自己犯下的「历史错误」,LeCun发文痛批硅谷一大常见病——错位优越感。DeepSeek的终极意义在哪?圈内热转的这篇分析指出,相比R1,R1-Zero具有更重要的研究价值,因为它打破了终极的人类输入瓶颈!

来自主题: AI资讯
6269 点击    2025-02-02 18:01
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭

o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭

o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭

一场改写AI历史的震撼对决正在上演!就在昨天,当DeepSeek R1还在用「降维打击」重构AI格局时,OpenAI王者回归之作o3-mini已悄然降临,用实力证明——王者,从未离场!

来自主题: AI产品测评
7792 点击    2025-02-02 13:34
进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

春节假期未过半,DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。 今天一觉醒来, DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录,开发人员可以快速地进行实验、迭代,并将这款热门模型集成到他们的工作流程中。

来自主题: AI资讯
6804 点击    2025-02-01 18:54
了解GRPO,你可能会反思Deepseek R1的提示词方法,看AI顿悟《了凡四训》后的Aha时刻

了解GRPO,你可能会反思Deepseek R1的提示词方法,看AI顿悟《了凡四训》后的Aha时刻

了解GRPO,你可能会反思Deepseek R1的提示词方法,看AI顿悟《了凡四训》后的Aha时刻

"Deepseek R1不就是一个参数更大的语言模型吗?随便问问题就行了,还需要什么特殊技巧?"——当你说出这句话时,是否意识到自己正像《西游记》里高举紫金葫芦的妖怪,对着齐天大圣叫嚣:"我叫你的名字,你敢答应吗?"

来自主题: AI技术研报
8127 点击    2025-01-30 13:53
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

昨晚,杭州大模型又双叒不睡,给大伙儿拜年啦~就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹:Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。

来自主题: AI资讯
5488 点击    2025-01-29 12:40